V2EX  ›  英汉词典
Enqueued related words: Jaccard Index

Cosine Similarity

Definition / 定义

余弦相似度:一种衡量两个向量(如文本特征、用户偏好、词向量等)方向是否相近的指标,取它们夹角余弦值。值通常在 -1 到 1 之间(很多非负特征场景下常见为 0 到 1);越接近 1 表示越相似,越接近 0 表示相关性弱。常用于信息检索、文本相似度、推荐系统与机器学习特征比较。

Pronunciation / 发音

/ˈkoʊsaɪn ˌsɪməˈlærɪti/

Examples / 例句

We used cosine similarity to compare two documents.
我们用余弦相似度来比较两篇文档。

After converting sentences into embeddings, the model ranks answers by cosine similarity to the query, reducing the effect of text length.
把句子转换成向量表示后,模型按与查询的余弦相似度对答案排序,从而减弱文本长度带来的影响。

Etymology / 词源

cosine 来自数学术语 “cosine(余弦)”,与 “sine(正弦)”同属三角函数体系;similarity 源自拉丁语 similis(相似的)。该短语在现代计算机科学与信息检索中被广泛采用,用“夹角的余弦”来表达“向量方向上的相似程度”。

Related Words / 相关词汇

Literary Works / 文学作品举例

  • Introduction to Information Retrieval(Manning, Raghavan, Schütze):在向量空间模型中讨论文档相似度时常用到 cosine similarity。
  • Speech and Language Processing(Jurafsky & Martin):在分布式表示、相似度度量等章节中常提及余弦相似度的使用场景。
  • Data Mining: Concepts and Techniques(Han, Kamber, Pei):在文本挖掘与相似度/距离度量相关内容中会出现该术语。
关于   ·   帮助文档   ·   自助推广系统   ·   博客   ·   API   ·   FAQ   ·   Solana   ·   1417 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 14ms · UTC 16:18 · PVG 00:18 · LAX 08:18 · JFK 11:18
♥ Do have faith in what you're doing.